უცხოური პირდაპირი ინვესტიციების დეტერმინანტების ანალიზი საქართველოში

ზურაბ კირკიტაძე

ჟურნალი ნომერი 2 ∘ ზურაბ კირკიტაძე ∘
უცხოური პირდაპირი ინვესტიციების დეტერმინანტების ანალიზი საქართველოში

რეზიუმე

ნაშრომში განხილულია რა შემთხვევაში გამოიყენება სხვადასხვა სახის რეგრესია და ჩატარებულია პროცედურები, რომელთა საფუძველზე, ცვლადებს შორის კავშირთა მახასიათებლებიდან გამომდინარე არის შერჩეული შესაბამისი რეგრესია. შემდეგ ეტაპზე განიხილება ამ შესაბამისი რეგრესიის თითოეული ვარიანტი და დატესტილია შერჩეული რეგრესიის შესაბამისი ვარიანტის დაშვებები იმისათვის, რომ უფრო ზუსტი რეგრესიული ანალიზის შედეგები მივიღოთ. შემდეგ ეტაპზე შერჩეულია შესაბამისი რეგრესია, რაც დამოკიდებული იყო შერჩეული მოდელის დაშვებათა დატესტვაზე და, შესაბამისად, ერთ-ერთი დაშვების არ დაკმაყოფილებაზე (კერძოდ, გამოვლინდა მულტიკოლინეარობა დამოუკიდებელ ცვლადებს შორის). შემდეგ ეტაპზე დასაბუთებულია, თუ რატომ არ იქნა გამოყენებული სხვა რეგრესიის მეთოდოლოგიები. სტატიის საბოლოო ნაწილში გამოყენებულია შერჩეული რეგრესიის მულტიკოლინეარობის მოგვარების ალტერნატიული მეთოდი და გამოვლენილია ეკონომეტრიკულ მოდელში ჩართული საბოლოო ცვლადები.

წინამდებარე გამოკვლევაში პირველ ეტაპზე ვეცდებით რეგრესიის სწორი მეთოდოლოგიის შერჩევას, რაც ეკონომეტრიკული ანალიზის აუცილებელი წინაპირობაა. რეგრესიულ მეთოდოლოგიაში მოიაზრება: ჩვეულებრივი უმცირეს კვადრატთა მეთოდი, ორსტადიანი უმცირეს კვადრატთა მეთოდი, მაქსიმალური ალბათობის მეთოდი, ორგანზომილებიანი (მარტივი) წრფივი რეგრესია, არაპარამეტრიკული რეგრესია, ლოგისტიკური რეგრესია, ბაიესიანური რეგრესია, რობასტული რეგრესია როგორიცაა M-ესტიმატორი, ბუნდოვანი (fuzzy) რეგრესია, შემთხვევითი/რანდომული კოეფიციენტების რეგრესია, l1 და q-კვანტილური რეგრესია, რეგრესია სივრცულ სფეროში, მრავლობითი რეგრესია, ქედის (ridge) რეგრესია, პოლინომიალური რეგრესია, ნახევარპარამეტრიკული რეგრესია და არაწრფივი უმცირეს კვადრატთა მეთოდი. ასევე შევამოწმებთ, მართებული იქნება თუ არა ავტორეგრესიული მოდელის, ავტორეგრესიული ინტეგრირებული მცოცავი საშუალოს მოდელის ან ავტორეგრესიული მცოცავი საშუალოს მოდელის გამოყენება იმის შემოწმებით, არსებობს თუ არა ავტოკორელაცია იმ ცვლადში, რომლის მოდელირებასაც ვახდენთ. ასევე შესაძლოა საჭირო გახდეს სეზონური ავტორეგრესიული ინტეგრირებული მცოცავი საშუალოს მოდელის გამოყენება, რომელიც გვჭირდება სეზონური მონაცემების მოდელირებისას ანუ დამოკიდებული ცვლადი არის სეზონური. ასევე გავითვალისწინებთ საზღვარგარეთის ქვეყნებში გამოყენებულ უპის პროგნოზირების მეთოდებს. სტატია მნიშვნელოვანია იმიტომ, რომ გამოვავლინეთ ის ფაქტორები, რომლებიც იწვევს უპი-ის შემოდინებას საქართველოში, კერძოდ, პირველ ეტაპზე დავადგინეთ თეორიულად მნიშვნელოვანი ფაქტორები, ხოლო მეორე ეტაპზე ეკონომეტრიკის გამოყენებით ამ რამდენიმე ფაქტორიდან დავადასტურეთ რომ ფაქტორების შედარებით მცირე რიცხვი მართლაც მნიშვნელოვან როლს ასრულებს უცხოური პირდაპირი ინვესტიციების (უპი) მოზიდვაში. სტატიის ავტორმა ახლებურად გააანალიზა საინვესტიციო აქტივობის ზრდის ძირითადი ფაქტორები.

საკვანძო სიტყვები: რეგრესიული ანალიზი, ინტერპრეტაცია, საქართველო, რეგრესიული ანალიზის შედეგები, ეკონომეტრიკა

პროცედურები სწორი რეგრესიის ამოსარჩევად და სწორი რეგრესიის დადგენა

პარამეტრიკული რეგრესია უნდა იქნეს გამოყენებული, როდესაც კავშირი დამოკიდებულ ცვლადსა და თითოეულ დამოუკიდებელ ცვლადს შორის ცნობილია. პარამეტრიკული რეგრესიის მოდელები მოიცავს: წრფივ მოდელებს, გენერალიზებულ წრფივ მოდელებს და არაწრფივ მოდელებს ვინაიდან ვიცით ფუნქცია, რომელიც აღწერს კავშირს დამოკიდებულ და დამოუკიდებელ ცვლადებს შორის.

არაპარამეტრიკული რეგრესია გამოიყენება მაშინ, როდესაც კავშირი დამოკიდებულ ცვლადსა და დამოუკიდებელ ცვლადებს შორის არის უცნობი და არაწრფივი. ნახევარპარამეტრიკული რეგრესიული მოდელები გამოიყენება მაშინ, როდესაც ვიცით რა კავშირია დამოკიდებულ ცვლადსა და დამოუკიდებელი ცვლადების ნაწილს შორის და არ ვიცით, თუ როგორი კავშირია ამ დამოკიდებულ ცვლადსა და დამოუკიდებელი ცვლადების სხვა ნაწილს შორის.

შესაბამისად, იმისათვის, რომ დავადგინოთ, თუ რომელი მეთოდი (პარამეტრიკული, ნახევარპარამეტრიკული თუ არაპარამეტრიკული) გამოვიყენოთ პირველ ეტაპზე, მართებულად მიგვაჩნია, დავადგინოთ რომელი ცვლადები ჩავრთოთ მოდელში. საბოლოო მოდელში ჩასართავი პოტენციური ცვლადებია: უპი-დამოკიდებული ცვლადი, დამოუკიდებელი ცვლადები-მშპ მუდმივ ფასებში, დასაქმებულთა საშუალო თვიური ნომინალური ხელფასი, სამომხმარებლო ფასების ინდექსი (ინფლაცია), ეროვნული შემოსავალი, სუბსიდიები, მოსახლეობის რიცხოვნობა და იმპორტ-ექსპორტი. როდესაც გვაქვს ბევრი დამოუკიდებელი ცვლადი და გვინდა მხოლოდ შესაბამისი (მნიშვნელოვანი) ამოვირჩიოთ ამ სიმრავლიდან, ეს შესაძლოა ჩატარდეს stepwise least squares-ის გამოყენებით (ამ stepwise least squares-ის გამოყენება დაგვეხმარება ჩვეულებრივი უმცირეს კვადრატთა მეთოდის ერთ-ერთი მოთხოვნის დაკმაყოფილებაშიც, კერძოდ იმაში, რომ ყველა შესაბამისი დამოუკიდებელი ცვლადი იყოს ჩართული მოდელში იმისათვის, რომ მივიღოთ უფრო ზუსტი რეგრესიული ანალიზის შედეგები). ამ მეთოდის გამოყენებისას უნდა დავადგინიოთ ის ცვლადები, რომელიც ყველანაირ ვარიანტში დარჩება მოდელში (ანუ, თეორიულად, ის ცვლადები, რომლებიც, დიდი ალბათობით, ახსნის დამოკიდებული ცვლადის ცვლილებას), რომლებიც ჩაიწერება ივიუსში ასეთი მეთოდის გამოყენებისას შესაბამის ველში. ასევე დასადგენია ის ცვლადები, რომლებიც შეიძლება (არა აუცილებლად) დაემატოს ძირითად მოდელს, ანუ შესაბამის ველში მიუთითებ იმ ცვლადებს, რომლებიც თეორიულად დაბალი ალბათობით მოახდენს ზეგავლენას დამოკიდებულ ცვლადზე. stepwise least squares დაგვეხმარება ასევე შემდეგში: 1) თუ R-კვადრატი (დეტერმინაციის კოეფიციენტი) არცთუ მაღალია (მაგალითად, უდრის 0.4) ან ძალიან დაბალია. ეს შესაძლოა მეტყველებდეს იმაზე რომ მოდელში არ იქნა ჩართული მნიშვნელოვანი დამოუკიდებელი ცვლადები (ფაქტორები), რაც დასტურდება რაღაცა დონემდე იმით, რომ თუ დამოუკიდებელი ცვლადები ცოტაა, R-კვადრატი დაბალია იმ შემთხვევასთან შედარებით, როდესაც დამატებითი ფაქტორები ემატება მოდელს, თუმცა ეს ზრდა მცდარია, რა შემთხვევაშიც ყურადღება უნდა გავამახვილოთ კორექტირებულ დეტერმინაციის კოეფიციენტზე. შესაბამისად, უნდა მივენდოთ R-კვადრატის იმ დონემდე ზრდას, როდესაც მხოლოდ შესაბამისი ფაქტორები იქნა ჩართული მოდელში და არ უნდა შევიყვანოთ ზედმეტი ფაქტორული ნიშნები ისე, რომ დეტერმინაციის კოეფიციენტი გახდეს მაქსიმალური ანუ 1-ის ტოლი, რაც დასტურდება იმით, რომ როდესაც დეტერმინაციის კოეფიციენტი არის 1-ის ტოლი, ეს ყოველთვის არ ნიშნავს იმას, რომ მოდელი არის ძალიან კარგი. ამიტომ საჭიროა გამოვიყენოთ stepwise least squares, იმისათვის, რომ ბევრი დამოუკიდებელი ცვლადიდან მხოლოდ მნიშვნელოვანი ცვლადები ჩავრთოთ მოდელში [1]. 2) stepwise least squares დაგვეხმარება პარსიმონიული მოდელის შექმნაშიც. ტრადიციულად, სტატისტიკური მოდელირების მიზანი იყო (არის) მოძებნა ყველაზე პარსიმონიული მოდელისა, ანუ ისეთი მოდელისა, რომელსაც აქვს რაც შეიძლება ნაკლები დამოუკიდებელი ცვლადები, რომელიც დამაკმაყოფილებლად პროგნოზირებს დამოკიდებულ ცვლადს. პარსიმონიული მოდელის აუცილებლობაზე მეტყველებს მაგალითად ის ფაქტი, რომ პოლინომიალური მოდელების არჩევისას თუ ორი პოლინომიალური მოდელის დეტერმინაციის კოეფიციენტი არის თითქმის ერთი და იმავე, მაშინ ვირჩევთ უფრო დაბალი თანრიგის პოლინომიალს, მაგალითად კუბური პოლინომიალის მაგივრად ვირჩევთ კვადრატულ პოლინომიალს. ასევე პარსიმონიული მოდელის არჩევით თავიდან ავიცილებთ ოვერფითინგსაც, რის საფუძველზეც შესაძლოა მივიღოთ უფრო ზუსტი კოეფიციენტები, p-ღირებულება და R-კვადრატი.

შემდეგ ეტაპზე ვატარებთ სხვადასხვა ტესტს, რომელთა საფუძველზე დავადგინეთ შემდეგი: როგორც ჩანს, ექსპორტი და სუბსიდიებიც იქნა მიჩნეული მნიშვნელოვან ცვლადებად. გამოტოვებული ცვლადების ტესტის თანახმად, ცვლადები ექსპორტი და სუბსიდიები არ არის ერთობლივად მნიშვნელოვანი. ვალდის ტესტის თანახმად, ცვლადები ექსპორტი და სუბსიდიები არაარსებითია. ზედმეტი ცვლადების ტესტის თანახმად, ცვლადები ექსპორტი და სუბსიდიები ზედმეტია მოდელში. Likelihood ratio test-ის თანახმად, ცვლადები ექსპორტი და სუბსიდიები არამნიშვნელოვანი ცვლადებია. საბოლოო ანგარიშით, ამ ნაწილში გაბედულად შეგვიძლია იმის თქმა, რომ ექსპორტი და სუბსიდიები არამნიშვნელოვანი ცვლადებია.

შემდეგ ეტაპზე ვამოწმებთ, თუ რა სახის კავშირია დამოკიდებულ ცვლადსა და თითოეულ დამოუკიდებელ ცვლადს შორის სკეთერ ფლოთის გამოყენებით. ეს სქემა გამოსახავს კავშირს ორ რაოდენობრივ ცვლადს შორის, ხოლო ჩვენი ცვლადები შეიცავს ვალუტას და ასევე ერთი ცვლადი მოსახლეობის რიცხოვნობაა. შესაბამისად შეგვიძლია სკეთერ ფლოთის გამოყენება ცვლადებს შორის კავშირის ასახსნელად. შემდეგ გვერდებზე არის სკეთერ ფლოთებზე გამოსახული კავშირი ცვლადებს შორის. შეგვიძლია ვიმსჯელოთ კავშირთა სიძლიერიდან გამომდინარე, რამდენად ძლიერი წრფივი კავშირია ამ ცვლადებს შორის. რაც უფრო ძლიერია წრფივი კავშირი, მით უფრო ახლოს არის წერტილები გამოსახული სკეთერ ფლოთზე პირდაპირ ხაზთან. ასევე კავშირთა სიძლიერეზე შესაძლოა ვიმსჯელოთ კორელაციის კოეფიციენტიდან გამომდინარე. ,კერძოდ, რაც უფრო ახლოსაა კორელაციის კოეფიციენტი +1-თან ან -1-თან, მით უფრო ძლიერია კავშირი, რაც ნიშნავს იმას, რომ სკეთერ ფლოთზე არსებული წერტილები მით უფრო ახლოს არის პირდაპირ ხაზთან. ვინაიდან უპი-ის ვადგენთ სხვა ცვლადებიდან გამომდინარე, ანუ ის წარმოადგენს დამოკიდებულ ცვლადს, უპი აიგება ვერტიკალურ ღერძზე, ხოლო სხვა ცვლადები ჴ ჰორიზონტალურ ღერძზე. კავშირი უპი-სა და მეგშ შორის არის დადებითი სუსტი წრფივი კავშირი, კავშირი უპი-სა და საშუალო თვიურ ნომინალურ ხელფასს შორის არის წარმოდგენილი 6 თანრიგის პოლინომიალური მოდელით, ე.ი კავშირი არაწრფივია, კავშირი უპი-სა და იმპორტს შორის არის დადებითი წრფივი ძლიერი კავშირი, კავშირი უპი-სა და მოსახლეობის რიცხოვნობას შორის არის წარმოდგენილი 6 თანრიგის პოლინომიალით, ე.ი. არაწრფივია, ხოლო კავშირი უპი-სა და მშპ შორის არის რაღაცა დონით ძლიერი დადებითი წრფივი კავშირი.
შესაბამისად, ვინაიდან ვიცით, თუ რა კავშირია დამოკიდებულ ცვლადსა და თითოეულ დამოუკიდებელ ცვლადს შორის, შეგვიძლია გამოვიყენოთ პარამეტრიკული რეგრესია. ხოლო არაპარამეტრიკული რეგრესიის არგამოყენება საბუთდება ასევე იმით, რომ არაპარამეტრიკულ პროცედურებზე იძახიან, რომ იგი არაადეკვატურია როდესაც ცვლადის დაკვირვებათა რიცხვი მცირეა და ასეთი რეგრესია დაკვირვებების დიდ რიცხვს ითხოვს და პლუს, ამასთან ერთად, არაპარამეტრიკულ რეგრესიაში უფრო მწვავედ დგას ის საკითხი, რომ რაც უფრო მეტია დაკვირვებები, მით უკეთესია პროგნოზები. ჩვენ შემთხვევაში თითოეულ ცვლადზე არის 12 დაკვირვება, ხოლო შერჩეული ერთობლიობა ითვლება დიდად, თუკი არის მეტი ან ტოლი 30-ისა, ხოლო პარამეტრიკული მოდელების დროს ჰარელის თანახმად, თითოეულ ცვლადზე უნდა იყოს მინიმუმ 10 დაკვირვება, რომ გარანტირებული იყოს ზუსტი პროგნოზები [2.გვ.2] და ეს ასეა ბევრი მკვლევარის თანახმად. ჩვენ კი გვაქვს 12 დაკვირვება თითეულ ცვლადზე.

გამომდინარე იქიდან, რომ პარამეტრიკული მოდელები არის წრფივი და არაწრფივი, უნდა განვიხილოთ ორივე მათგანი და ავირჩიოთ ის, რომელიც უკეთესია. წრფივი მოდელია ის, სადაც პარამეტრები არის პირველ ხარისხში, ხოლო არაწრფივია მოდელი, სადაც პარამეტრიც არის აყვანილი ხარისხში ან პარამეტრი წარმოადგენს ხარისხს. შევადაროთ წრფივი და არაწრფივი მოდელი:
უპი=c(1)*ხელფასი+c(2)*რეალური
მშპ+c(3)*მოსახლეობის რიცხოვნობა+c(4)*მეგშ+c(5)*იმპორტი+c(6)
უპი=c(1)+c(2)^2*იმპორტი+c(3)^3*მეგშ+c(4)*მოსახლეობის რიცხოვნობა+c(5)* რეალური მშპ+c(6)*ხელფასი
ამ ორი მოდელის შესადარებლად გამოვიყენოთ რეზიდუალ ფლოთი. ამ წესის თანახმად ვირჩევთ წრფივ მოდელს. თუმცა ამ ორი მოდელის შედარებისას უკეთესი იქნებოდა თუ ავირჩევდით ბევრი არაწრფივი მოდელიდან საუკეთესოს აკაიკის საინფორმაციო კრიტერიუმით (ორი მოდელიდან ისაა უკეთესი, რომელსაც უფრო დაბალი აკაიკის საინფორმაციო კრიტერიუმი აქვს) და ამ საუკეთესოს შევადარებდით წრფივ მოდელს. თუმცა ეს დროის დიდ ხარჯთან არის დაკავშირებული.

შემდეგ ეტაპზე, ვინაიდან ავირჩიეთ წრფივი მოდელი, მნიშვნელოვანია დავტესტოთ, კმაყოფილდება თუ არა წრფივი რეგრესიის ვარაუდები/მოთხოვნები იმისათვის, რომ უფრო ზუსტი რეგრესიული ანალიზის შედეგები მივიღოთ. წრფივი რეგრესიის ვარაუდების/მოთხოვნების დატესტვის მერე დადგინდა, რომ მოთხოვანათა უმეტესობა კმაყოფილდება გარდა იმისა, რომ გამოვლინდა მულტიკოლინეარობა დამოუკიდებელ ცვლადებს შორის. როგორც ჩანს, საკმაოდ მწვავედ დგას ჩვენ შემთხვევაში მულტიკოლინეარობის პრობლემა. აქედან გამოსავალია მთავარ კომპონენტთა რეგრესია, თუმცა ერთგან ეწერა რომ იგი იწვევს უფრო მეტ პრობლემებს ვიდრე აგვარებს მათ. შესაბამისად, გაურკვევლობის გამო ვიყენებთ ქედის (ridge) რეგრესიას, რომლის სარგებლიანობა არის ყველაზე მეტად გასაოცარი, როდესაც არსებობს მულტიკოლინეარობა [3.გვ.5]. ამ უკანასკნელის შემთხვევაში კოეფიციენტთა შეფასება უმცირეს კვადრატთა მეთოდით იძლევა კოეფიციენტთა არამიკერძოებულ შეფასებებს, თუმცა ასეთ დროს კოეფიციენტთა სტანდარტული შეცდომები დიდია. ასე რომ, ისინი შეიძლება შორს იყოს რეალური მნიშვნელობებისგან; ხოლო ქედის რეგრესია ამცირებს სტანდარტულ შეცდომებს და იძლევა კოეფიციენტთა უფრო რეალურ სტანდარტულ შეცდომებს. მაშასადამე, კოეფიციენტთა შესაფასებლად ვიყენებთ ქედის (ridge) რეგრესიას. თუმცა, შესაძლოა საჭირო გახდეს ორსტადიანი უმცირეს კვადრატთა მეთოდის გამოყენება თუ რომელიმე დამოუკიდებელი ცვლადი იქნა ენდოგენური. ენდოგენურია თუ არა დამოუკიდებელი ცვლადი, შესაძლოა შემოწმდეს ენდოგენურობის ტესტით, რომელიც ტარდება მას შემდეგ, რაც დავამტკიცებთ ინსტრუმენტული ცვლადების შესაბამისობას. ინსტრუმენტული ცვლადია ის, რომელიც კორელირებულია დამოუკიდებელ ცვლადთან, მაგრამ არ არის კორელირებული შეცდომით წევრთან, რომელიც ჩართულია მოდელში. თუ საჭირო გახდა ორსტადიანი უმცირეს კვადრატთა მეთოდის გამოყენება, მაშინ ამ ორ მეთოდს შევადარებთ საშუალო კვადრატული შეცდომის თანახმად და ამ ორი მეთოდიდან ამოვირჩევთ იმას, რომელსაც ექნება უფრო დაბალი საშუალო კვადრატული შეცდომა, რომელიც ამ შემთხვევაში არ იანგარიშება რეზიდუალობიდან გამომდინარე. საშუალო კვადრატული შეცდომა იანგარიშება შემდეგი ფორმულით:
standard error(B)^2+[Bias(B, Btrue)^2)]
უფრო ადვილი გზაა ამოვირჩიოთ არამიკერძებული ესტიმატორი, როდესაც საშუალო კვადრატული შეცდომა უდრის მხოლოდ კოეფიციენტის ვარიაციას (სტანდარტული შეცდომა აყვანილი კვადრატში). საშუალო კვადრატული შეცდომა იანგარიშება თითოეული კოეფიციენტისათვის.

ჩავატაროთ ქედის რეგრესია პროგრამა ესპიესესში. თუმცა ვინაიდან ესპიესესი ვერ ატარებს ამ მაკროს, მაშინ მულტიკოლინეარობის მოგვარებას სხვა მეთოდებით ვეცდებით, რაზედაც საუბარი გვექნება ამ სტატიის საბოლოო ნაწილში.

რეგრესიის სხვა მეთოდოლოგიების გამოუყენებლობის
დასაბუთება
ახლა, იმისათვის, რომ დავადგინოთ არის თუ არა რომელიმე დამოუკიდებელი ცვლადი ენდოგენური, პირველ ეტაპზე ჩავატაროთ ინსტრუმენტული ცვლადების ვალიდობის ტესტი. ვთქვათ, ასეთი ენდოგენური დამოუკიდებელი ცვლადია იმპორტი. მაგალითად, მასთან კორელირებული ცვლადია შინამეურნეობის შემოსავალი, რაც აიხსნება შემდეგით: თუ გაიზარდა შინამეურნეობების შემოსავალი, მაშინ მათ შეიძლება უფრო მეტი აწარმოონ, უფრო მეტი გაყიდონ და იმავდროულად შესაძლოა შემცირდეს იმპორტი, ვინაიდან ასეთ შემთხვევაში შესაძლოა ვეღარ გავყიდოთ იმპორტირებული პროდუქცია. ასევე ინსტრუმენტულ ცვლადად ავიღებთ საშუალო შემოსავალს ერთ სულზე. ინსტრუმენტული ცვლადების შესაბამისობის ტესტის თანახმად, დამტკიცდა მათი ვალიდობა ე.ი. შეგვიძლია ჩავატაროთ ენდოგენურობის ტესტი. ჩვენ შემთხვევაში იმპორტი არ არის ენდოგენური ე.ი. არ ვატარებთ ორსტადიან უმცირეს კვადრატთა მეთოდს. უკეთესი იქნებოდა თითეული დამოუკიდებელი ცვლადის ენდოგენურობის შემოწმება ყველა შესაძლო ინსტრუმენტული ცვლადის გამოყენებით თუმცა ამას არ ვაკეთებთ, ვინაიდან ეს დროის დიდ ხარჯთან არის დაკავშირებული.

არ ვიყენებთ ლოგისტიკურ რეგრესიას, ვინაიდან არ გვაქვს დიქოტომიური დამოკიდებული ცვლადი. თუმცა შეგვეძლო დამოკიდებული ცვლადის კოდირება ისე, რომ რაღაცა მნიშვნელობის ზევით მიიღებდა მნიშვნელობად 1 დამოკიდებული ცვლადი, ხოლო ამ მნიშვნელობის ქვევით დამოკიდებული ცვლადი მიიღებდა მნიშვნელობად 0-ს. თუმცა თუ ასე გავაკეთებთ მაშინ ვერ შევძლებთ დამოკიდებული ცვლადის ზუსტი მნიშვნელობის იდენტიფიკაციას და ამიტომ არ ვიყენებთ ლოგისტიკურ რეგრესიას.

ანალიზის პროცესში არ ვიყენებთ მარტივ რეგრესიას, ვინაიდან მივიჩნიეთ რომ, უპიზე ზემოქმედებს ერთზე მეტი ფაქტორი.
ბაიესიანური რეგრესია არ გამოგვიყენებია, ვინაიდან ასეთი რეგრესიის დროს ვანგარიშობთ ალბათობას, რომ კოეფიციენტს ექნება კონკრეტული მნიშვნელობა, გამომდინარე მონაცემებიდან, და ჩვენი წინასწარი ცოდნიდან, რაც ამ სტატიაში არ ყოფილა ჩვენი მიზანი.

რობასტულ რეგრესიას, როგორიცაა M-ესტიმატორი, არ ვიყენებთ, ვინაიდან ეს მეთოდი გამოიყენება აუთლაიერების დროს და როგორც ჩვენ მანამდე გავანაალიზეთ, ჩვენ არ გვქონია ცვლადებში აუთლაიერები.

ბუნდოვან (fuzzy) რეგრესიას არ ვიყენებთ, ვინაიდან, მაგალითად, იგი გამოიყენება, როდესაც დამოკიდებული ცვლადი იღებს მნიშვნელობებად შემდეგს: დაბალი, საშუალო და მაღალი, ხოლო ჩვენ შემთხვევაში გვაინტერესებდა უპი-ის კონკრეტული მნიშვნელობის პროგნოზირება

რანდომული კოეფიციენტების რეგრესიას არ ვიყენებთ ვინაიდან ეს რეგრესია ითხოვს პანელურ მონაცემებს, ხოლო ჩვენ არ გვაქვს ინფორმაცია მაგალითად, რა იყო დინამიკაში წარმოების ღირებულება თითოეული ქართული ფირმის შემთხვევაში, თუმცა პანელური მონაცემები შეგვეძლო აგვეღო ეკონომიკის სექტორების გამოყენებით, რასაც ასევე ვერ გავაკეთებთ, ვინაიდან მოდელში არსებულ ზოგიერთ ცვალდზე არ გვაქვს ეს ინფორმაცია, მაგალითად, არ გვაქვს ცვლად იმპორტზე თუ რა იყო მისი ზომა ეკონომიკის სექტორების მიხედვით. აღნიშნული მიზეზების გამო არ ვიყენებთ არც პანელურ რეგრესიას.

L1 რეგრესიას არ ვიყენებთ, ვინაიდან იგი გამოიყენება, როდესაც დამოკიდებულ ცვლადში არის აუთლაიერები, ხოლო ჩვენ უპი-ის შემთხვევაში ისინი არ გვქონია

Q-კვანტილურ რეგრესიას არ ვიყენებთ ვინაიდან ჩვენი მიზანი არ ყოფილა Q-პირობითი კვანტილის დამოკიდებული ცვლადის მოდელირება.

რეგრესიას სივრცულ სფეროში არ ვიყენებთ, რაც გამოწვეულია შემდეგი მიზეზებით: სივრცული სფერო წარმოადგენს მონაცემებს, რომლითაც დგინდება პლანარული ობიექტის კონტურები, როგორიცაა, მაგალითად, სამკუთხედი და მონეტა, ხოლო ჩვენ შემთხვევაში არ გვქონია ასეთ რამესთან შეხება.

პოლინომიალურ რეგრესიას არ ვიყენებთ, ვინაიდან იგი გამოიყენება ნაცვლად წრფივი რეგრესიისა, როდესაც კავშირი საშედეგო ნიშანსა და ფაქტორულ ნიშანს შორის არის არაწრფივი, ხოლო ჩვენ შემთხვევაში მათ შორის კავშირი იყო მეტად თუ ნაკლებად წრფივი.

კორელაციურ ანალიზს არ ვიყენებთ, ვინაიდან ის აუცილებლად არ ნიშნავს მიზეზობრიობას, ხოლო ჩვენ შემთხვევაში გვაინტერესებდა რამდენად იწვევდა ერთი ცვლადი მეორეს. თუმცა კორელაციის კოეფიციენტიდან გამომდინარე, შესაძლოა მივიღოთ გადაწყვეტილება, ჩავრთოთ თუ არა ცვლადი მოდელში, ვინაიდან კორელაციის არსებობისას შესაძლოა იყოს მიზეზობრივი კავშირი დამოკიდებულ და დამოუკიდებელ ცვლადებს შორის ან იგი შეიძლება იყოს დამთხვევითი (ერთის ზრდისას თუ იზრდება მეორე, მაშინ ეს შესაძლოა იყოს მხოლოდ დამთხვევის გამო).

არ ვიყენებთ ასევე ავტორეგრესიულ მოდელს კონკრეტული მიზეზების გამო. მისი გამოუყენებლობით დასტურდება ასევე ის, რომ არ გამხდარა საჭიროება დამოუკიდებელ ცვლადად გამოგვეყენებინა დამოკიდებული ცვლადის ლაგი.

ანალიზის შემდეგ ეტაპზე დავადგინოთ გამოვიყენოთ თუ არა სეზონური მოდელი. არ ვიყენებთ ამ უკანასკნელს კონკრეტული მიზეზების გამო. ასევე არ ვიყენებთ ტრენდულ მოდელსაც ვინაიდან უპი-ის დინამიკის დროს, გრაფიკული სურათის თანახმად, უპი ხანგრძლივი დროის განმავლობაში არ ხასიათდებოდა ზრდით ან კლებით.

ასევე, მოკლედ რომ ვთქვათ, არ ვიყენებთ უპი-ის პროგნოზირების საზღვარგარეთ არსებულ მეთოდებს კონკრეტული მიზეზების გამო. შესაბამისად, ნაკლები პროგნოზირების მეთოდების გამო ვერ ვახერხებთ პროგნოზების შედარებას იმის დასადგენად, თუ რამდენად ზუსტია პროგნოზირების რომელიმე საუკეთესო მეთოდი.

ასევე, რეგრესიული ანალიზის პროცესში, იმისათვის, რომ კოეფიციენტის T-სტატისტიკიდან გამომდინარე გამოვიტანოთ ვალიდური დასკვნები რეგრესიის კოეფიციენტის არსებითობის შესახებ, საჭიროა მოდელში შეყვანილი დამოკიდებული ცვლადი იყოს სტაციონალური [4]. რეგრესიის დროს არ არის აუცილებელია, დამოუკიდებელი ცვლადები იყოს სტაციონალური, მაგრამ აუცილებელია რომ დამოკიდებული ცვლადი იყოს სტაციონალური. ჩვენ შემთხვევაში უპი სტაციონალურია, ანუ არ გვაქვს არასტაციონარობის პრობლემები. იმ შემთხვევაში, თუ აღმოჩნდა, რომ ორივე – დამოკიდებული და დამოუკიდებელი ცვლადები არის არასტაციონალური, მაშინ უმჯობესი იქნება იმის შემოწმება, რომ არიან თუ არა ცვლადები კოინტეგრირებული, ვინაიდან არასოდეს არ უნდა ჩაატარო რეგრესია არასტაციონალურ ცვლადებზე. გამონაკლისია ის შემთხვევა, როდესაც მოდელში არსებული ცვლადები არის კოინტეგრირებული.

შერჩეული რეგრესიის ალტერნატიული მეთოდი მულტიკოლინეარობის მოსაგვარებლად

ჱხლჱ შჵვჵხოთ მულტიკოლინჵჱროჲის მოჳვჱრჵჲის სხვჱ მჵთოჴს. პირვჵლ ჵტჱპზჵ ჴჱვხჵჴოთ ფჱქტორული ნიშნჵჲის VIF (variance inflation factor). თუ ჵს მჱჩვჵნჵჲჵლი ჱრის 10 ჱნ 10-ზჵ მჵტი, მჱშინ ჳვჱქვს მულტიკოლინეარობის პრობლემა. ამ მაჩვენებლის შემოწმების მერე მივიღეთ პროგრამა ესპიესესში ფაქტორებისათვის ამ მაჩვენებლის ძალიან მაღალი მნიშვნელობები. ე.ი დამტკიცდა მაღალი კორელაციის მაჩვენებლების არსებობა ფაქტორებს შორის. თუკი გვაქვს ორი ან მეტი ფაქტორი მაღალი VIF-ით, მაშინ შეგვიძლია მოდელს მოვაცილოთ ერთ-ერთი (დავამტკიცოთ ამ ცვლადების ამოღება ასევე ცვლადების P-ღირებულებიდან გამომდინარე). ვინაიდან ასეთი ფაქტორები ზედმეტ ინფორმაციას იძლევა, ერთ-ერთის მოცილება კორელირებული ფაქტორებიდან დეტერმინაციის კოეფიციენტს მნიშვნელოვნად არ ამცირებს. დამოუკიდებელი ცვლადების P-ღირებულება თითეული ცვლადის დროს იყო მნიშვნელოვნად მეტი 0.01-ზე (0.01 და არა 0.05 იმიტომ ავიღეთ, რომ ვატარებდით მრავლობით რეგრესიას, შერჩეული ერთობლიობა იყო პატარა და რეზიდუალები იყო არანორმალურად განაწილებული. ნორმალურობის ტესტად გამოვიყენეთ შაფირო ვილკის ტესტი, ვინაიდან რეზიდუალების დაკვირვებათა რიცხვი იყო 2000-ზე ნაკლები). თუ ვიფი არის 100-ზე მეტი, მაშინ სარწმუნოდ არსებობს მულტიკოლინეარობა. შესაბამისად ამოვაგდებთ მოდელიდან ცვლადებს რეალურ მშპ-სა და მთლიან ეროვნულ განკარგვად შემოსავალს და დავაკვირდებით R-კვადრატის ცვლილებას [5]. ამოღებული ცვლადები იძლეოდა ზედმეტ ინფორმაციას, რაც დასტურდება იმითაც, რომ R-კვადრატი მნიშვნელოვნად არ შემცირებულა. მულტიკოლინეარობის პრობლემის ნაწილობრივ მოგვარება დასტურდება იმით, რომ მოდელში დარჩენილი ცვლადების ვიფი ერთი ცვლადის დროს იყო ნაკლები 10-ზე და სხვა ორი ცვლადის დროს ძალიან ცოტათი აღემატება 10-ს. ე.ი საინვესტიციო აქტივობის ზრდის ფაქტორებად გამოვლინდა ხელფასი, იმპორტი და მოსახლეობის რიცხოვნობა. რეგრესიული ანალიზის შედეგების განხილვისას/მოდელის დიაგნოსტიკის დროს პირველი ეტაპია იმის შემოწმება, არის თუ არა შესაბამისობაში კოეფიციენტის ნიშანი თეორიასთან. მოსახლეობის რიცხოვნობას ჰქონდა უარყოფითი კოეფიციენტი, რაც ეწინააღმდეგება თეორიას, ეს კი ნიშნავს, რომ მოსახლეობის რიცხოვნობის ზრდისას უპი მცირდება (თანაც საქართველოში იყვნენ ძირითადად ბაზრის ათვისებაზე ორიენტირებული ინვესტორები). თუ ცვლადის კოეფიციენტის ნიშანი არ შეესაბამება თეორიას, მაშინ შეიძლება გვქონდეს სერიოზული მულტიკოლინეარობა, რაც ჩვენს შემთხვევაში VIF-ის თანახმად გამოირიცხა. მცირე მულტიკოლინეარობა არ არის დიდი პრობლემა. ე.ი მოდელს რაღაც სხვა პრობლემები აქვს, რისი მოგვარებაც ვერ მოხერხდება ერთ სტატიაში. ასევე ცვლადების P-ღირებულებიდან გამომდინარე, ცვლადები არაარსებითია, რაც ადასტურებს იმას, რომ მოდელს რაღაც პრობლემები აქვს. რაც შეეხება R-კვადრატს, მისი მნიშვნელობა 0.588 სავსებით დამაკმაყოფილებელია ორი მიზეზის გამო 1) მეტია 0.577; 2) რეგრესიაში არ არის მიზანი R-კვადრატის მაქსიმიზაცია არაშესაბამისი ცვლადების ჩართვით მოდელში. მიუხედავად ცვლადების P-ღირებულებებიდან გამომდინარე, არაარსებითად მიჩნეული ცვლადები შესაძლოა მივიჩნიოთ საკმარისად ინფორმატიულად, ვინაიდან თითოეულ ცვლადზე დაკვირვებათა რიცხვი მცირეა და დაზუსტებული R-კვადრატი არის არც ნული და არც უარყოფითი [6].

დასასრულ, არ ვაკეთებთ პროგნოზებს, ვინაიდან გვაინტერესებდა საინვესტიციო აქტივობის ზრდის ძირითადი ფაქტორების ანალიზი, რაც შესაძლებელია მხოლოდ რეგრესიული ანალიზის შედეგების განხილვის საფუძველზეც.

დასკვნა

დასკვნის სახით შეგვიძლია ვთქვათ, რომ მოსახლეობის რიცხოვნობა უნდა ყოფილიყო ზუსტადაც მნიშვნელოვანი ცვლადი და არა მეგშ, რაც აიხსნება იმით, რომ მეგშ არის მთლიანი შემოსავალი, რაც იხარჯება პროდუქციის შეძენაზ, მისი ზრდა კი თეორიულად უნდა მოხდეს მდიდარი ფენის კიდევ უფრო გამდიდრების საფუძველზე. ვინაიდან მდიდარი ფენა საქართველოში მოსახლეობის მცირე წილს წარმოადგენს, თუ მეგშ გაიზარდა მნიშვნელოვნად, მაშინ ეს უფრო მდიდრების საფუძველზე მოხდება, ანუ მეგშ-ის გაზრდა მეტყველებს იმაზე, რომ ცოტა ადამიანის შემოსავალი მნიშვნელოვნად გაიზარდა, რაც, თავის მხრივ, არ გამოიწვევს ბაზრის ათვისებაზე ორიენტირებული ინვესტორის პროდუქციის დიდად რეალიზაციას, ხოლო თუ მოსახლეობის რიცხოვნობა მნიშვნელოვნად გაიზარდა მდიდრების რიცხოვნობის ზრდის გარდა, შესაძლოა ასევე მნიშვნელოვნად გაიზარდოს საშუალო ფენა, რაც დამატებით განაპირობებს ინვესტორის პროდუქციის რეალიზაციას, რომელიც ორიენტირებულია ბაზრის ათვისებაზე. ანუ ჩვენი რეგრესიის შედეგებით მტკიცდება ჩვენი წამოყენებული ჰიპოთეზა მიუხედავად იმისა, რომ მოსახლეობის რიცხოვნობის კოეფიციენტი უარყოფითია, რომელიც, წესით, დადებითი უნდა გახდეს უკეთეს მოდელში.

სტატიის სიახლე იმაში მდგომარეობს, რომ მასში პირველად მოხდა საინვესტიციო აქტივობის ზრდის ძირითადი ფაქტორების ანალიზი ახლებური მიდგომით და მხოლოდ შესაბამისი (მნიშვნელოვანი) ფაქტორები იქნა გამოვლენილი ავტორის მიერ. კერძოდ, სხვადასხვა ტესტის თანახმად მრავალი ფაქტორიდან ამოღებულ იქნა ექსპორტი და სუბსიდიები და ასევე სხვა დამატებითი პროცედურების ჩატარების მერე დადგინდა, რომ საინვესტიციო აქტივობის ზრდის ძირითად ფაქტორებად გვევლინება ხელფასი, იმპორტი და მოსახლეობის რიცხოვნობა.

გამოყენებული ლიტერატურა

1. http://www.eviews.com/help/helpintro.html#page/content/Regress2-Stepwise_Least_Squares_Regression.html
2. Peter C. Austin, Ewout W. Steyerberg, The number of subjects per variable required in a linear regression analyses.
3. Patrick Breheny, Ridge regression.
4. James Forest, university of Massachusetts, www.researchgate.net
5. http://blog.minitab.com/blog/understanding-statistics/handling-multicollinearity-in-regression-analysis
6. https://people.duke.edu/~rnau/rsquared.htm